Nouvelle approche de bi-partitionnement topologique
نویسندگان
چکیده
Résumé. Dans ce papier, nous proposons une nouvelle approche topologique de bi-partitionnement (bi-clustering) appelée BiTM en utilisant les cartes autoorganisatrices. L’idée principale de l’approche est d’utiliser une seule carte pour le partitionnement simultané des lignes (observations) et des colonnes (variables). Contrairement aux approches utilisant les cartes topologiques, notre modèle ne nécessite pas de pré-traitement de la base de données. Ainsi, une nouvelle fonction de coût est proposée. De plus, BiTM fournit une visualisation topologique des blocs ou bi-clusters facilement interprétable. Les résultats obtenus sont très encourageants et prometteurs pour continuer dans cette optique.
منابع مشابه
Pondération de blocs de variables en bi-partitionnement topologique
Résumé. Dans cet article, nous proposons une nouvelle approche permettant à la fois le bi-partitionnement topologique (bi-clustering) et la pondération de blocs variables. Le modèle que nous proposons FBR-BiTM (Feature Block Relevance using BiTM) permet de découvrir un espace topologique d’un ensemble d’observations et de variables en associant un nouveau score de pondération à chaque sous ense...
متن کاملUne nouvelle approche visuelle pour la classification hiérarchique et topologique
Résumé. Nous proposons dans cet article une nouvelle méthode de classification hiérarchique et topologique. Notre approche consiste à construire de manière auto-organisée une partition de données représentées par un ensemble "forêt" d’arbres répartis sur une grille 2D. Chaque cellule de la grille est modélisée par un arbre dont les noeuds représentent les données. La partition globale obtenue e...
متن کاملChoix d'une mesure de proximité discriminante dans un contexte topologique
Résumé. Les résultats de toute opération de classification ou de classement d’objets dépendent fortement de la mesure de proximité choisie. L’utilisateur est amené à choisir une mesure parmi les nombreuses mesures de proximité existantes. Or, selon la notion d’équivalence topologique choisie, certaines sont plus ou moins équivalentes. Dans cet article, nous proposons une nouvelle approche de co...
متن کاملClustering topologique pour le flux de données
Résumé. Actuellement, le clustering de flux de données devient le moyen le plus efficace pour partitionner un très grand ensemble de données. Dans cet article, nous présentons une nouvelle approche topologique, appelée G-Stream, pour le clustering de flux de données évolutives. La méthode proposée est une extension de l’algorithme GNG (Growing Neural Gas) pour gérer le flux de données. G-Stream...
متن کاملEquivalence topologique entre mesures de proximité
Résumé. Le choix d’une mesure de proximité entre objets a un impact direct sur les résultats de toute opération de classification, de comparaison, d’évaluation ou de structuration d’un ensemble d’objets. Pour un problème donné, l’utilisateur est amené à choisir une parmi les nombreuses mesures de proximité existantes. Or, selon la notion d’équivalence choisie, comme celle basée sur les préordon...
متن کامل